DivFusion
对输入逐元素做除法运算,并对实数类型结果应用 ReLU激活。
\[\text{对于实数类型:}\quad output_i = \max\left(\frac{input0_i}{input1_i}, 0\right)\]
\[\text{对于复数类型:}\quad output_i = \frac{input0_i}{input1_i}\]
- 输入:
input0 - 被除数输入数据地址。
input1 - 除数输入数据地址。
length - 计算长度。
core_mask(int, 可选) - 核掩码(仅适用于共享存储版本)。
- 输出:
output - 计算结果地址。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持 int8, int16, int32, fp32, fp64, cplx64, cplx128
MT7004 支持 fp16, fp32, int16, int32, cplx64
对于复数类型(cplx64 / cplx128)不应用 ReLU,仅返回复数除法结果。
若除数元素为 0,结果为 Inf/NaN 或未定义,需由上层处理。
共享存储版本:
-
void i8_div_fusion_s(int8_t *input0, int8_t *input1, int8_t *output, int length, int core_mask)
-
void i16_div_fusion_s(int16_t *input0, int16_t *input1, int16_t *output, int length, int core_mask)
-
void i32_div_fusion_s(int32_t *input0, int32_t *input1, int32_t *output, int length, int core_mask)
-
void hp_div_fusion_s(half *input0, half *input1, half *output, int length, int core_mask)
-
void fp_div_fusion_s(float *input0, float *input1, float *output, int length, int core_mask)
-
void dp_div_fusion_s(double *input0, double *input1, double *output, int length, int core_mask)
-
void c64_div_fusion_s(float *input0, float *input1, float *output, int length, int core_mask)
-
void c128_div_fusion_s(double *input0, double *input1, double *output, int length, int core_mask)
C调用示例:
1//FT78NE示例(共享存储) 2#include <stdio.h> 3 4int main(int argc, char* argv[]) { 5 float *input0 = (float *)0xA0000000; // input0 在 DDR 空间 6 float *input1 = (float *)0xA1000000; // input1 在 DDR 空间 7 float *output = (float *)0xB0000000; // 输出在 DDR 空间 8 int length = 1024; 9 int core_mask = 0xff; 10 fp_div_fusion_s(input0, input1, output, length, core_mask); 11 return 0; 12}
私有存储版本:
-
void i8_div_fusion_p(int8_t *input0, int8_t *input1, int8_t *output, int length)
-
void i16_div_fusion_p(int16_t *input0, int16_t *input1, int16_t *output, int length)
-
void i32_div_fusion_p(int32_t *input0, int32_t *input1, int32_t *output, int length)
-
void hp_div_fusion_p(half *input0, half *input1, half *output, int length)
-
void fp_div_fusion_p(float *input0, float *input1, float *output, int length)
-
void dp_div_fusion_p(double *input0, double *input1, double *output, int length)
-
void c64_div_fusion_p(float *input0, float *input1, float *output, int length)
-
void c128_div_fusion_p(double *input0, double *input1, double *output, int length)
C调用示例:
1//MT7004 示例 2#include <stdio.h> 3 4int main(int argc, char* argv[]) { 5 float *input0 = (float *)0x10000000; 6 float *input1 = (float *)0x10001000; 7 float *output = (float *)0x10002000; 8 int length = 1024; 9 fp_div_fusion_p(input0, input1, output, length); 10 return 0; 11}